<html>
 <head>
  <meta charset="utf-8"/>
  <meta content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no" name="viewport"/>
  <title>
   媒体报道 – 从数据中看规律 | 数螺 | NAUT IDEA
  </title>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap-theme.min.css" rel="stylesheet"/>
  <link href="http://cdn.bootcss.com/bootstrap/3.3.6/css/bootstrap.min.css" rel="stylesheet"/>
  <style type="text/css">
   #xmain img {
                  max-width: 100%;
                  display: block;
                  margin-top: 10px;
                  margin-bottom: 10px;
                }

                #xmain p {
                    line-height:150%;
                    font-size: 16px;
                    margin-top: 20px;
                }

                #xmain h2 {
                    font-size: 24px;
                }

                #xmain h3 {
                    font-size: 20px;
                }

                #xmain h4 {
                    font-size: 18px;
                }


                .header {
	           background-color: #0099ff;
	           color: #ffffff;
	           margin-bottom: 20px;
	        }

	        .header p {
                  margin: 0px;
                  padding: 10px 0;
                  display: inline-block;  
                  vertical-align: middle;
                  font-size: 16px;
               }

               .header a {
                 color: white;
               }

              .header img {
                 height: 25px;
              }
  </style>
  <script src="http://cdn.bootcss.com/jquery/3.0.0/jquery.min.js">
  </script>
  <script type="text/x-mathjax-config">
   MathJax.Hub.Config({tex2jax: {inlineMath: [['$','$'], ['\\(','\\)']], processEscapes: true}});
  </script>
  <script src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=TeX-AMS-MML_HTMLorMML%2CSafe.js&amp;ver=15f5e1fcddf0b88517244c085cc07855" type="text/javascript">
  </script>
  <script src="http://nautstatic-10007657.file.myqcloud.com/static/css/readability.min.js" type="text/javascript">
  </script>
  <script type="text/javascript">
   $(document).ready(function() {
                 var loc = document.location;
                 var uri = {
                  spec: "http://blog.cos.name/taoshi/category/%E5%AA%92%E4%BD%93%E6%8A%A5%E9%81%93/",
                  host: "http://blog.cos.name",
                  prePath: "http://blog.cos.name",
                  scheme: "http",
                  pathBase: "http://blog.cos.name/"
                 };
    
                 var documentClone = document.cloneNode(true);
                 var article = new Readability(uri, documentClone).parse();
     
                 document.getElementById("xmain").innerHTML = article.content;
                });
  </script>
  <!-- 1466463000: Accept with keywords: (title(0.333333333333):媒体报道,数据,规律, topn(0.233333333333):大家,数字,媒体报道,算子,抽样,眼保健操,江湖,格斯,玻色子,画外音,数据分析,文章,金额,手气,统计局,站台,数据,诗文,置信区间,统计分析,样本,科学,伦茨,基尼系数,红包,粒子,对撞机,杂志,发红包,奥林匹克).-->
 </head>
 <body class="archive category category-63 light-theme-pale-blue suffusion-custom preset-1000px device-desktop" onload="">
  <div class="header">
   <div class="container">
    <div class="row">
     <div class="col-xs-6 col-sm-6 text-left">
      <a href="/databee">
       <img src="http://nautidea-10007657.cos.myqcloud.com/logo_white.png"/>
      </a>
      <a href="/databee">
       <p>
        数螺
       </p>
      </a>
     </div>
     <div class="hidden-xs col-sm-6 text-right">
      <p>
       致力于数据科学的推广和知识传播
      </p>
     </div>
    </div>
   </div>
  </div>
  <div class="container text-center">
   <h1>
    媒体报道 – 从数据中看规律
   </h1>
  </div>
  <div class="container" id="xmain">
   <nav class="tab fix" id="nav-top">
    <div class="col-control left">
     <ul class="sf-menu">
      <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-home menu-item-1587 dd-tab" id="menu-item-1587">
       <a href="http://blog.cos.name/taoshi">
        首页
       </a>
      </li>
      <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-1590 dd-tab" id="menu-item-1590">
       <a href="http://blog.cos.name/taoshi/about/">
        关于
       </a>
      </li>
      <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-1588 dd-tab" id="menu-item-1588">
       <a href="http://statisticsforfun.com">
        English
       </a>
      </li>
     </ul>
    </div>
    <!-- /.col-control -->
   </nav>
   <!-- /#nav-top -->
   <div class="fix" id="wrapper">
    <div class="custom-header fix" id="header-container">
     <header class="fix" id="header">
      <h1 class="blogtitle left">
       <a href="http://blog.cos.name/taoshi">
        从数据中看规律
       </a>
      </h1>
      <div class="description right">
       快乐统计数据分析
      </div>
     </header>
     <!-- /header -->
     <nav class="tab fix" id="nav">
      <div class="col-control left">
       <!-- right-header-widgets -->
       <div class="warea" id="right-header-widgets">
        <form action="http://blog.cos.name/taoshi/" class="searchform " method="get">
        </form>
       </div>
       <!-- /right-header-widgets -->
       <ul class="sf-menu">
        <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-home menu-item-1587 dd-tab">
         <a href="http://blog.cos.name/taoshi">
          首页
         </a>
        </li>
        <li class="menu-item menu-item-type-post_type menu-item-object-page menu-item-1590 dd-tab">
         <a href="http://blog.cos.name/taoshi/about/">
          关于
         </a>
        </li>
        <li class="menu-item menu-item-type-custom menu-item-object-custom menu-item-1588 dd-tab">
         <a href="http://statisticsforfun.com">
          English
         </a>
        </li>
       </ul>
      </div>
      <!-- /col-control -->
     </nav>
     <!-- /nav -->
    </div>
    <!-- //#header-container -->
    <div class="fix" id="container">
     <div id="main-col">
      <div class="hfeed" id="content">
       <article class="full-content post-2597 post type-post status-publish format-standard hentry category-63 category-61 category-84 category-66 tag-171 tag-170 category-63-id category-61-id category-84-id category-66-id post-seq-1 post-parity-odd meta-position-corners fix" id="post-2597">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2014/04/13/%e5%a4%b1%e8%81%94%e6%90%9c%e6%95%91%e4%b8%ad%e7%9a%84%e7%bb%9f%e8%ae%a1%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="bookmark" title="失联搜救中的统计数据分析">
            失联搜救中的统计数据分析
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/" rel="category tag">
             统计
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1%e5%ba%94%e7%94%a8/" rel="category tag">
             统计应用
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2014/04/13/%e5%a4%b1%e8%81%94%e6%90%9c%e6%95%91%e4%b8%ad%e7%9a%84%e7%bb%9f%e8%ae%a1%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/#respond">
             No Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           4月
          </span>
          <span class="day">
           13
          </span>
          <span class="year">
           2014
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2014-04-13T07:50:35+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <blockquote>
           <p>
            大数据时代如何活用数据可视化、大数据与众包、群体智慧、贝叶斯方法等为失联搜救出谋献策？请看下文。
           </p>
          </blockquote>
          <p>
           作者：统计之都创作小组（code99）众筹做业（
           <a href="http://yishuo.org/" target="_blank">
            邓一硕
           </a>
           ，
           <a href="http://blog.sina.com.cn/cattyguan" target="_blank">
            关菁菁
           </a>
           ，
           <a href="http://chenangliu.info/" target="_blank">
            刘辰昂
           </a>
           ，
           <a href="http://yixuan.cos.name/cn/" target="_blank">
            邱怡轩
           </a>
           ，
           <a href="http://blog.cos.name/taoshi/" target="_blank">
            施涛
           </a>
           ，
           <a href="http://weibo.com/u/1572842322" target="_blank">
            熊熹
           </a>
           ，周祺）
          </p>
          <p>
           感谢统计之都资深顾问谢益辉和香港浸会大学数学讲座教授汤涛在写作工程中提出的宝贵建议。
          </p>
          <p>
           <strong>
            引子
           </strong>
          </p>
          <p>
           “MH370”作为航班代码，是近日震惊世界的马来西亚航空公司客机失去联络事件（后简称“马航事件”）留给公众最深刻的数字印象。时至今日，有关马航事件的调查和搜救工作仍在继续。遗憾的是直到截稿时间，MH370航班的残骸仍未找到。
          </p>
          <p>
           在历史上的多次飞机船只等交通工具出现失联情况的突发事件中，数据的收集、分析以及信息的及时发布都在搜寻中起到过关键的作用。比如在2009年，法国航空公司曾有一架民航客机失去联络和踪迹。当时，有不少基于数据分析的文献为失事飞机的搜寻提供了援助。前事不忘，后事之师。本文旨在基于统计学领域的相关知识结合大众可以获知的信息来对马航事件进行了解和分析。本文秉持科普视角，试图阐述在应对马航事件过程中数据收集和数据分析所起到的作用，继而为寻找失联飞机提供一些思路。我们将以寻找失事飞机和船只的事件为线索，来梳理其中涉及到的数据分析思路，以试图减少大家的猜疑和困惑。
          </p>
          <p>
           <strong>
            <span class="more-link fix">
             <a class="more-link" href="http://blog.cos.name/taoshi/2014/04/13/%e5%a4%b1%e8%81%94%e6%90%9c%e6%95%91%e4%b8%ad%e7%9a%84%e7%bb%9f%e8%ae%a1%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/#more-2597">
              Continue reading »
             </a>
            </span>
           </strong>
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 07:50
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e5%a4%a7%e6%95%b0%e6%8d%ae%ef%bc%8c%e4%bc%97%e5%8c%85/" rel="tag">
           大数据，众包
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e9%a9%ac%e8%88%aa%ef%bc%8c%e8%b4%9d%e5%8f%b6%e6%96%af%ef%bc%8c%e7%be%a4%e4%bd%93%e6%99%ba%e6%85%a7/" rel="tag">
           马航，贝叶斯，群体智慧
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-2541 post type-post status-publish format-standard hentry category-63 category-61 category-23 category-84 category-3 tag-cos tag-114 tag-167 tag-183 tag-166 tag-168 category-63-id category-61-id category-23-id category-84-id category-3-id post-seq-2 post-parity-even meta-position-corners fix" id="post-2541">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2014/02/13/%e6%96%b0%e5%b9%b4%e5%88%b0%ef%bc%8c%e5%8f%91%e7%ba%a2%e5%8c%85%ef%bc%88%e4%b9%8b%e4%b8%80%ef%bc%89%e5%a4%a7%e5%ae%b6%e5%a6%82%e4%bd%95%e5%8f%91%e7%ba%a2%e5%8c%85%ef%bc%9f/" rel="bookmark" title="新年到，发红包（之一）大家如何发红包？">
            新年到，发红包（之一）大家如何发红包？
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98/" rel="category tag">
             数据挖掘
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/" rel="category tag">
             统计
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e9%97%b2%e6%89%af/" rel="category tag">
             闲扯
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2014/02/13/%e6%96%b0%e5%b9%b4%e5%88%b0%ef%bc%8c%e5%8f%91%e7%ba%a2%e5%8c%85%ef%bc%88%e4%b9%8b%e4%b8%80%ef%bc%89%e5%a4%a7%e5%ae%b6%e5%a6%82%e4%bd%95%e5%8f%91%e7%ba%a2%e5%8c%85%ef%bc%9f/#comments">
             4 Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           2月
          </span>
          <span class="day">
           13
          </span>
          <span class="year">
           2014
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2014-02-13T03:10:14+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           微信红包在马年来临之际着实是火了一把。在抢红包的兴奋中，大家欢欢喜喜的过了个年。红包红包漫天飞，谁抢到归谁。。。
          </p>
          <p style="text-align: left">
           <img src="http://img.ithome.com/newsuploadfiles/2014/1/20140128_222649_24.jpg"/>
          </p>
          <p style="text-align: left">
           要说最火的，还是这个“拼手气群红包”。发红包者自定红包总额和红包个数，由微信随机决定每个来领红包的群友所领到红包的金额。放下拼手气的一面以后再谈，这个红包发放平台顷刻间就产生了一些“大数据”。有人问了，这数据能算大叔句？腾讯科技文章《
           <a href="http://tech.qq.com/a/20140131/001281.htm" target="_blank">
            指尖上的除夕：在线娱乐方式的时代变迁
           </a>
           》中报道：
          </p>
          <blockquote>
           <p>
            根据
            <a href="https://www.tenpay.com/" target="_blank">
             财付通
            </a>
            官方统计，截止1月30日除夕夜，平均每个红包10.7元，抢了最多红包的：869个。除夕夜参与红包活动的总人数达到482万，最高峰出现在零点时分，瞬间峰值达到每分钟2.5万个红包被拆开。
           </p>
          </blockquote>
          <p>
           数据不小哦！更哇呀呀丫的是：869个红包，点屏幕的手都要麻了吧。
          </p>
          <p style="text-align: left">
           鉴于经常游走在数据和统计边缘，混迹于
           <a href="http://cos.name" target="_blank">
            COS
           </a>
           八卦群中，不由得想想这些数据有神马神用途吗？没准可以写篇像前几年科学杂志上发表的 《
           <a href="http://blog.cos.name/taoshi/2011/10/07/science_twitter_work/" rel="bookmark" target="_blank" title="《科学》：Twitter反映人们工作压力巨大 (真的吗？)">
            Twitter反映人们工作压力巨大
           </a>
           》的高端文章呢 🙂
          </p>
          <p style="text-align: left">
           那研究什么呢？红包这东西，收到的人开心（除了本人这类没法绑定银行卡，无法提现的，哭！），发红包的人也挺开心。要不就研究一下红包的发放喜好？没准这结果和传统风俗沾个边，可以申请个中华文化遗产神马的。说干就干！
          </p>
          <p style="text-align: left">
           一般定下心来做事时，才发现开头总是很尴尬的。丰满的理想是冲着CNS去的，骨感的现实是到哪去拿这大数据。不免想到一个关于大数据的出处不详，翻译从略的神评论：
          </p>
          <blockquote>
           <p>
            Big Data is like teenage sex: Everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it too.
           </p>
          </blockquote>
          <p style="text-align: left">
           谁让咱是干统计这行的呢，虽然没有微信的内部数据，但咱马上有办法。抽样呗！
          </p>
          <ul>
           <li>
            把自己抢到的十几个红包数据录入电脑。这时画外音响起：“同学，这不科学！数据量太小了”
           </li>
           <li>
            好吧，找到个有趣有闲的
            <a href="http://taiyun.cos.name">
             COSer
            </a>
            ，把他抢到的上百个红包数据录入。画外音又响起：“抽样课上学的都还给老师了吗？这不科学，不是随机样本”
           </li>
           <li>
            再好吧，搞个
            <a href="http://www.wenjuan.com/s/YzIFV3/" target="_blank">
             网上调查
            </a>
            ，再找
            <a href="http://www.weibo.com/mathematicalculture" target="_blank">
             @数学文化
            </a>
            等大V推广一下，这下你总满意了吧。画外音：“¥＃＊&amp;％¥＃。。。”
           </li>
           <li>
            有完没完，就这样了！再说我就。。。有种你收集个随机样本我看看？
           </li>
          </ul>
          <p style="text-align: left">
           数据拿来分析一下再说，共收录到144个群红包。这篇就只谈每个群红包的总额和红包个数了。先上图：
          </p>
          <div class="wp-caption aligncenter" style="width: 585px">
           <a href="http://i.imgur.com/Ta4Vl27.jpg">
            <img src="http://i.imgur.com/Ta4Vl27.jpg"/>
           </a>
           <p class="wp-caption-text">
            每个群红包总额的分布
           </p>
          </div>
          <p style="text-align: left">
           大家对6和8以及各种整数的偏好很明显吗。再看每个群红包发给多少人。
          </p>
          <div class="wp-caption aligncenter" style="width: 585px">
           <a href="http://i.imgur.com/SytBr0Y.jpg">
            <img src="http://i.imgur.com/SytBr0Y.jpg"/>
           </a>
           <p class="wp-caption-text">
            每个群红包所发人数
           </p>
          </div>
          <p style="text-align: left">
           好像20个人以下居多哦，没有太多散财童子出现，呵呵！然后该是每个群发红包的平均金额了吧。
          </p>
          <div class="wp-caption aligncenter" style="width: 585px">
           <a href="http://i.imgur.com/a2gXrTE.jpg">
            <img src="http://i.imgur.com/a2gXrTE.jpg"/>
           </a>
           <p class="wp-caption-text">
            平均红包金额
           </p>
          </div>
          <p style="text-align: left">
           除了发现一个888元包十个红包的土豪，别的都在平均50元以下。所有144个群红包的平均红包金额为7.08元，和财富通发布的“平均每个红包10.7元”的大数据结果有些差距。不过看下图：
          </p>
          <div class="wp-caption aligncenter" style="width: 585px">
           <a href="http://i.imgur.com/BgzOQQ4.jpg">
            <img src="http://i.imgur.com/BgzOQQ4.jpg"/>
           </a>
           <p class="wp-caption-text">
            红包平均金额 v.s. 红包发放个数
           </p>
          </div>
          <p style="text-align: left">
           原来红包平均金额和红包发放个数还有点关系呢。这位COSer同学（嗑嗑，说你呢），你都是从哪抢的红包啊？
          </p>
          <ul>
           <li>
            COSer: 抢到的平均红包金额 4.63元
           </li>
           <li>
            其他人：抢到的平均红包金额 14.31元
           </li>
          </ul>
          <p style="text-align: left">
           太拖累大家了，又都被你平均了:) 不过非常感谢你顶风冒雪地去输入数据，我决定把我抢来的红包一次性转发给你，拉高你的平均值。
          </p>
          <p style="text-align: left">
           好吧，这次就先到这，休息一下。下篇再来研究微信这个手气红包到底多拼手气 。。。
          </p>
          <p style="text-align: left">
           －－－－－－－－－－－－－－－－－－－－－－－－－－－－－
          </p>
          <p style="text-align: left">
           p.s. 非常感谢各位在网上贡献数据的朋友：牛肉干，Anfeifei，zy，聪葱，苏建冲 等
          </p>
          <p style="text-align: left">
           p.p.s. 有兴趣CNS的同学都再去为
           <a href="http://www.wenjuan.com/s/YzIFV3/" target="_blank">
            网上调查
           </a>
           贡献几个红包数据吧，我们可以写众包做业的可行性和可靠性分析什么的 🙂
          </p>
          <p style="text-align: left">
           p.p.p.s. 说个题外的，为吗我碰到的都说发出去红包总金额比收到的少很多呢？钱都去哪了？奥数好的给解释一下吧。。。（都被陈光标卷走了？）
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 03:10
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/cos/" rel="tag">
           COS
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%a4%a7%e6%95%b0%e6%8d%ae/" rel="tag">
           大数据
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%be%ae%e4%bf%a1/" rel="tag">
           微信
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e7%bb%9f%e8%ae%a1/" rel="tag">
           统计
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e7%bd%91%e4%b8%8a%e8%b0%83%e6%9f%a5/" rel="tag">
           网上调查
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e7%be%a4%e5%8f%91%e7%ba%a2%e5%8c%85/" rel="tag">
           群发红包
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-2173 post type-post status-publish format-standard hentry category-63 category-61 category-84 category-66 tag-128 tag-127 tag-126 category-63-id category-61-id category-84-id category-66-id post-seq-3 post-parity-odd meta-position-corners fix" id="post-2173">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2013/02/04/%e4%b8%ad%e5%9b%bd%e5%9f%ba%e5%b0%bc%e7%b3%bb%e6%95%b0%e4%bc%b0%e7%ae%97/" rel="bookmark" title="中国基尼系数估算中的统计问题">
            中国基尼系数估算中的统计问题
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/" rel="category tag">
             统计
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1%e5%ba%94%e7%94%a8/" rel="category tag">
             统计应用
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2013/02/04/%e4%b8%ad%e5%9b%bd%e5%9f%ba%e5%b0%bc%e7%b3%bb%e6%95%b0%e4%bc%b0%e7%ae%97/#comments">
             5 Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           2月
          </span>
          <span class="day">
           04
          </span>
          <span class="year">
           2013
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2013-02-04T09:00:13+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           看了基尼系数被吵的沸沸扬扬，咱也来掺糊一下。先从
           <a href="http://baike.baidu.com/view/186.htm" target="_blank">
            百度百科上抄一段
           </a>
           ：
          </p>
          <blockquote>
           <p>
            基尼系数（Gini coefficient），或译坚尼
            <a href="http://baike.baidu.com/view/960.htm" target="_blank">
             系数
            </a>
            ，是20世纪初意大利
            <a href="http://baike.baidu.com/view/31551.htm" target="_blank">
             经济学
            </a>
            家基尼，根据
            <a href="http://baike.baidu.com/view/3367636.htm" target="_blank">
             劳伦茨曲线
            </a>
            所定义的判断
            <a href="http://baike.baidu.com/view/604597.htm" target="_blank">
             收入
            </a>
            <a href="http://baike.baidu.com/view/4646736.htm" target="_blank">
             分配公平
            </a>
            程度的
            <a href="http://baike.baidu.com/view/605645.htm" target="_blank">
             指标
            </a>
            。是
            <a href="http://baike.baidu.com/view/339062.htm" target="_blank">
             比例
            </a>
            数值，在0和1之间，是国际上用来综合考察
            <a href="http://baike.baidu.com/view/10427.htm" target="_blank">
             居民
            </a>
            内部
            <a href="http://baike.baidu.com/view/604597.htm" target="_blank">
             收入
            </a>
            分配差异状况的一个重要分析指标。
           </p>
           <p>
            2012年12月初，
            <a href="http://baike.baidu.com/view/4906.htm" target="_blank">
             西南财经大学
            </a>
            中国家庭金融调查在京发布的报告显示，2010年中国家庭的基尼系数为0.61，大大高于0.44的全球平均水平。2013年
            <a href="http://baike.baidu.com/view/171909.htm" target="_blank">
             国家统计局
            </a>
            局长
            <a href="http://baike.baidu.com/view/491534.htm" target="_blank">
             马建堂
            </a>
            公布了过去十年中国基尼系数，系数导向意义引发关注。
           </p>
          </blockquote>
          <p>
           关于同一指数的两个差异很大的（点）估计，让大家有些摸不到头脑。对这两个不同估计的报道在这可以找到：
          </p>
          <ul>
           <li>
            <a href="http://finance.sina.com.cn/china/20121209/092913944148.shtml">
             2012年12月9日
            </a>
            ，媒体开始报道西南财经大学中国家庭金融调查在京发布的报告， 调查显示中国基尼系数达0.61。一时议论纷纷。这个“基尼系数”的微指数也随之飙升。
           </li>
           <li>
            <a href="http://finance.sina.com.cn/china/bwdt/20130118/124114331770.shtml" target="_blank">
             2013年1月18日
            </a>
            ，统计局：去年基尼系数为0.474 自08年起逐年回落。 公布当天，“基尼系数”的微指数更上一层楼。
           </li>
          </ul>
          <p>
           <a href="http://i.imgur.com/ZyF0Ux3.jpg">
            <img src="http://i.imgur.com/ZyF0Ux3.jpg"/>
           </a>
          </p>
          <p>
           而且和“统计局”的微指数还有些惺惺相惜。
          </p>
          <p>
           <img src="http://i.imgur.com/RveMZCi.png"/>
          </p>
          <p>
           那这基尼系数到底是个神马东西呢？根据在 Wikipedia 上的学习，让我来班门弄斧的解释一下（经济学家的砖头请等会在扔）
          </p>
          <p>
           首先，这个系数是关于一群 ($n$个) 人的，用统计的话讲，
           <strong>
            它是个总体的一个特征
           </strong>
           （你要叫参数也行）。对这群人咋定义这基尼系数呢？
          </p>
          <p>
           假设所有人的收入从小到大排序后是 $\{X_1, X_2, \ldots, X_n\}$， 到第 j 人为止的累计收入为 $\{S_j = X_1 + X_2 + \cdots + X_j,$ $ j=1, 2, \ldots, n\}$。到这了索性再把累计收入占人群总收入的比例$\{R_j = S_j / S_n, j=1, 2, \ldots, n\}$也一起算了。然后就可以画大名鼎鼎的
           <a href="http://en.wikipedia.org/wiki/Lorenz_curve" target="_blank">
            劳伦茨曲线
           </a>
           了，其实就是把$\{1/n, 2/n, \ldots, n/n \}$ 和$\{R_1, R_2, \ldots, R_n\}$匹配一下画个散点图（在R中用”l”选项就成线了），也就有了下面的Lorenz Curve。
          </p>
          <p style="text-align: center">
           <a href="http://en.wikipedia.org/wiki/Gini_coefficient">
            <img src="http://i.imgur.com/6cjwgLv.png"/>
           </a>
          </p>
          <p>
          </p>
          <p>
           如果收入绝对公平，$X_1=X_2=\cdots =X_n$，那这曲线就被掰直了（图中的Line of Equality）。劳伦茨曲线越靠近该直线就代表人群中的收入越平均。反之就越不平均。怎么刻画这两条线之间的差距呢？基尼系数就应运而生了：图中两条线中的面积（$A$）占总面积（$A+B$) 的比例
          </p>
          <p>
           \[\frac{A}{A+B}\]
          </p>
          <p>
           就是这神奇的系数了。
          </p>
          <p>
           按理说这基尼系数对国民经济刻画还是应该有些作用的，比如：联合国有关组织规定：通常把0.4作为收入分配差距的“警戒线”，0.6以上表示收入差距悬殊。
          </p>
          <p>
           对自己科普了之后，就好理解不同报道中的差异了。既然基尼系数是人群（国家）总体特征，要算它就的知道
           <strong>
            每个人
           </strong>
           的“
           <strong>
            收入
           </strong>
           ”。去把每个人收入数据搞齐费时费力，可能人都把十年前的收入忘了时，还没被问到呢。咋办呢？这个咱在行：抽样调查然后统计估计！这也就有了不同的抽样调查得到不同结果的情况了。
          </p>
          <p>
           结果不完全相同当然没问题，是抽样就有误差。但当两个试图估计同样总体特征的估计值之间得差距大到抽样误差没法解释的程度（有法解释吗？），那旁观者也就只好认定最少其中一个是不准确的了（当然也没法排除两个都不准确的可能性）。
          </p>
          <p>
           于是也就有了2013年2月2号的释疑文章：
           <a href="http://news.sina.com.cn/c/2013-02-02/023926181923.shtml?bsh_bid=189552118" target="_blank">
            统计局官员撰文释疑我国基尼系数数据来源
           </a>
           。
          </p>
          <ul>
           <li>
            国家统计局住户调查办公室主任王萍萍发表署名文章进行解释，称我国城乡住户收支调查共有14万户样本，这是基尼系数的基础数据。而这些数据来源明确，样本规范。
           </li>
           <li>
            王萍萍文中介绍，新指标是指2012年12月份以后实施的一体化住户调查制度中的可支配收入指标。新的可支配收入指标中既包括现金收入，也包括实物收入。按照来源可分为：
            <strong>
             工资性收入、经营净收入、财产净收入、转移净收入和自有住房折算净租金。
            </strong>
           </li>
           <li>
            在城乡合并样本数据的基础上，依据基尼系数计算公式，利用SAS(统计分析系统)软件计算出了全体居民的可支配收入基尼系数。
           </li>
          </ul>
          <p>
           如果有人有闲往这些页面下部的“我有话说”看一下，就还真得对统计局捏把汗。
          </p>
          <p>
           不管统计局得数据多么来源明确，样本规范，看官就是不信，而且好像没有一个信的。撇开对对样本规范的看法，大家对统计局对“收入”的官方定义都不怎么买帐，这也是统计局工作的为难之处：在现在的社会现实情况下去抽个样本了解收入。
          </p>
          <p>
           要是你今天有幸被抽中，你会怎么回答呢？这还真不是统计局能单独解决的问题。（另外，SAS也很不幸得躺着中了一枪 :)）
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 09:00
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e5%8a%b3%e4%bc%a6%e8%8c%a8%e6%9b%b2%e7%ba%bf/" rel="tag">
           劳伦茨曲线
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%8f%82%e6%95%b0%e4%bc%b0%e8%ae%a1/" rel="tag">
           参数估计
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%9f%ba%e5%b0%bc%e7%b3%bb%e6%95%b0%ef%bc%8c%e7%bb%9f%e8%ae%a1%e5%b1%80%ef%bc%8c%e5%be%ae%e6%8c%87%e6%95%b0/" rel="tag">
           基尼系数，统计局，微指数
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-2101 post type-post status-publish format-standard hentry category-63 category-61 category-84 category-3 tag-andrew-gelman tag-bayesian tag-frequentist tag-larry-wasserman tag-nate-silver tag-the-signal-and-the-noise category-63-id category-61-id category-84-id category-3-id post-seq-4 post-parity-even meta-position-corners fix" id="post-2101">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/12/07/frequentist-or-bayesian/" rel="bookmark" title="大话统计：Frequentist or Bayesian">
            大话统计：Frequentist or Bayesian
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/" rel="category tag">
             统计
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e9%97%b2%e6%89%af/" rel="category tag">
             闲扯
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/12/07/frequentist-or-bayesian/#comments">
             1 Response »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           12月
          </span>
          <span class="day">
           07
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-12-07T10:58:34+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           [前言：先向无法科学上网的客官作揖抱歉了，有些江湖野史可能被墙]
          </p>
          <p>
           话说江湖风云人物，神算子
           <a href="http://en.wikipedia.org/wiki/Nate_Silver" target="_blank">
            Nate Silver
           </a>
           ， 在纽约时报
           <a href="http://fivethirtyeight.blogs.nytimes.com" target="_blank">
            开博占卜
           </a>
           各项江湖话题，每每言中。并著书立传，
           <a href="http://www.us.penguingroup.com/static/pages/features/the_signal_and_the_noise.html" title="The Signal and the Noise - Books by Nate Silver - Penguin Group (USA)">
            The Signal and the Noise
           </a>
           ，一时引来
           <a href="http://cos.name/2012/11/the-rise-of-data-scientists/" target="_blank">
            各相追捧
           </a>
           。
          </p>
          <p>
           这日，曾留下武林秘籍
           <a href="http://www.amazon.com/All-Statistics-Statistical-Inference-Springer/dp/0387402721/" target="_blank">
            All of Statistics: A Concise Course in Statistical Inference
           </a>
           的大侠
           <a href="http://www.stat.cmu.edu/~larry/" target="_blank">
            Larry Wasserman
           </a>
           (Department of Statistics, Department of Machine Learning, Carnegie Mellon University) 突发感想，在自己博客
           <a href="http://normaldeviate.wordpress.com/" target="_blank">
            Normal Deviate
           </a>
           中写下大号书评：
          </p>
          <h2>
           <a href="http://taoshistat.wordpress.com/2012/12/06/2100/" rel="bookmark" title="Permanent Link to Nate Silver is a Frequentist: Review of ``the signal and the noise''">
            Nate Silver is a Frequentist: Review of “the signal and the noise”
           </a>
          </h2>
          <blockquote>
           <p>
            ［……］As you can see, I liked the book very much and I highly recommend it.
           </p>
           <p>
            But …
           </p>
           <p>
            I have one complaint. Silver is a big fan of Bayesian inference, which is fine. Unfortunately, he falls into that category I referred to
            <a href="http://normaldeviate.wordpress.com/2012/11/17/what-is-bayesianfrequentist-inference/">
             a few posts ago.
            </a>
            He confuses “Bayesian inference” with “using Bayes’ theorem.” His description of frequentist inference is terrible. He seems to equate frequentist inference with Fisherian significance testing, most using Normal distributions. Either he learned statistics from a bad book or he hangs out with statisticians with a significant anti-frequentist bias.
           </p>
           <p>
            Have no doubt about it: Nate Silver is a frequentist. For example, he says:
           </p>
           <p>
            <strong>
             “One of the most important tests of a forecast — I would argue that it is the single most important one — is called calibration. Out of all the times you said there was a 40 percent chance of rain, how often did rain actually occur? If over the long run, it really did rain about 40 percent of the time, that means your forecasts were well calibrated.”
            </strong>
           </p>
           <p>
            It does not get much more frequentist than that. And if using Bayes’ theorem helps you achieve long run frequency calibration, great. If it didn’t, I have no doubt he would have used something else. But his goal is clearly to have
            <strong>
             good long run frequency behavior
            </strong>
            .［……］
           </p>
          </blockquote>
          <p>
           一时间风雨突起，这个关于 Frequentist or Bayesian 的争议话题又现江湖。第一个杀出来的是？没错！正是大侠
           <a href="http://andrewgelman.com/" rel="external nofollow">
            Andrew Gelman
           </a>
           (Department of Statistics, Columbia University)，著名的
           <a href="http://andrewgelman.com/" title="Statistical Modeling, Causal Inference, and Social Science: ">
            Statistical Modeling, Causal Inference, and Social Science
           </a>
           的博主。
          </p>
          <blockquote>
           <p>
            Larry:
           </p>
           <p>
            There is such a thing as Bayesian calibration of probability forecasts. If you are predicting a binary outcome y.new using a Bayesian prediction p.hat (where p.hat is the posterior expectation E(y.new|y), then Bayesian calibration requires that E(y.new|y.hat) = y.hat for any y.hat. This isn’t the whole story (as always, calibration matters but so does precision), but it’s not the same as frequentist calibration or unbiasedness. In frequentist calibration, the expectation is taken conditional on the value of the unknown parameters theta in the model. The calibration you describe above (for another example, see
            <a href="http://andrewgelman.com/2010/11/some_thoughts_o_8/" rel="nofollow">
             here
            </a>
            and scroll down) is unconditional on theta, thus Bayesian. So I disagree with you that those calibrations are frequentist and not Bayesian. But of course I completely agree with you that the concept of frequency performance of methods is important. It’s just that Bayesian calibration does not condition on theta.
           </p>
          </blockquote>
          <p>
           江湖不宁，争论又起，各路人马
           <a href="http://normaldeviate.wordpress.com/2012/12/04/nate-silver-is-a-frequentist-review-of-the-signal-and-the-noise/#comments" target="_blank">
            加入论战
           </a>
           。大侠
           <a href="http://xianblog.wordpress.com" target="_blank">
            XI’AN’ OG
           </a>
           也出面提出把这场论战记入江湖册：
          </p>
          <blockquote>
           <p>
            Would you mind publishing this review in
            <a href="http://chance.amstat.org" target="_blank">
             CHANCE
            </a>
            , by any chance???
           </p>
          </blockquote>
          <p>
           看大侠们挥舞这各项理论和哲学思想，小的不尽倒吸一口凉气。
          </p>
          <p>
           问题原来是神算子是否属于少林派，还是武当派。怎么忽然就变成各派根据其所著之书，来统计推断其个人取向了呢？然后有演变为了两派镇派宝典根基的争论了。
          </p>
          <p>
           要是实在关心神算子心仪那派的问题，不如找来神算子本人问一下，到底人家对哪里更有归属感，不就行了。实在找不到本人，就@他，tweet 一下好了。。。。。。
          </p>
          <p>
           走你！
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 10:58
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/andrew-gelman/" rel="tag">
           Andrew Gelman
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/bayesian/" rel="tag">
           Bayesian
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/frequentist/" rel="tag">
           Frequentist
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/larry-wasserman/" rel="tag">
           Larry Wasserman
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/nate-silver/" rel="tag">
           Nate Silver
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/the-signal-and-the-noise/" rel="tag">
           The Signal and the Noise
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-2090 post type-post status-publish format-standard hentry category-63 category-62 tag-black-marble tag-nasa tag-virrs tag-112 tag-113 tag-114 category-63-id category-62-id post-seq-5 post-parity-odd meta-position-corners fix" id="post-2090">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/12/05/blue-marble-black-marble-our-planet/" rel="bookmark" title="白天不懂夜的黑">
            白天不懂夜的黑
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%a7%91%e5%ad%a6/" rel="category tag">
             科学
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/12/05/blue-marble-black-marble-our-planet/#respond">
             No Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           12月
          </span>
          <span class="day">
           05
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-12-05T22:44:05+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           大数据时代来了，但什么样的问题才需要大数据呢？我觉得答案挺直接的：大问题，没法简单抽样或抽样也没法解决的问题。
          </p>
          <p>
           今天很火爆的一张图是NASA用2.5兆兆字节(terabytes)卫星数据画的，地球的全球夜间灯光亮度图。
          </p>
          <div class="wp-caption aligncenter" style="width: 710px">
           <a href="http://eoimages.gsfc.nasa.gov/images/imagerecords/79000/79765/dnb_land_ocean_ice.2012.3600x1800.jpg">
            <img src="http://i.imgur.com/f6thJ.jpg"/>
           </a>
           <p class="wp-caption-text">
            Credit: Visible Infrared Imaging Radiometer Suite (NASA)
           </p>
          </div>
          <p>
           数据是NASA的
           <a href="http://npp.gsfc.nasa.gov/viirs.html" rel="bookmark" target="_blank">
            Visible Infrared Imaging Radiometer Suite
           </a>
           在今年4月和10月收集的，然后要经过一系列处理，去除极光，森林着火的火光，月光反射，等等各种光线，剩下的是估计的城市光线。
          </p>
          <blockquote>
           <p>
            The night time view of Earth was made possible by the “day-night band” of the
            <a href="http://npp.gsfc.nasa.gov/viirs.html" rel="bookmark" target="_blank">
             Visible Infrared Imaging Radiometer Suite
            </a>
            . VIIRS detects light in a range of wavelengths from green to near-infrared and uses filtering techniques to observe dim signals such as gas flares, auroras, wildfires, city lights, and reflected moonlight. In this case, auroras, fires, and other stray light have been removed to emphasize the city lights.
           </p>
          </blockquote>
          <p>
           这个我觉得是大数据的一个强项。要画这么精确，高分辨率的图，没有所有的数据和认真的分析是没法想象的。NASA提供的最高分辨率的图在这里(
           <a href="http://eoimages.gsfc.nasa.gov/images/imagerecords/79000/79765/dnb_land_ocean_ice.2012.54000x27000_geo.tif" target="_blank">
            384 MB, TIFF, 54000×27000
           </a>
           )，没有足够内存建议别碰。不过NASA搞了个灰常了得的幻灯片
           <a href="http://www.flickr.com//photos/gsfc/sets/72157632175125121/show/" target="_blank">
            Black Marble- City Lights 2012
           </a>
           。值得一看。
          </p>
          <p>
           以前这夜间图可是只有军方卫星才能看到的，现在也可以娱乐大众了。
          </p>
          <blockquote>
           <p>
            A handful of scientists have observed earthly night lights over the past four decades with military satellites and astronaut photography. But in 2012, the view became significantly clearer. The
            <a href="http://npp.gsfc.nasa.gov/" target="_blank">
             Suomi National Polar-orbiting Partnership
            </a>
            (NPP) satellite — launched in October 2011 by NASA, the National Oceanic and Atmospheric Administration (NOAA), and the Department of Defense — carries a low-light sensor that can distinguish night lights with six times better spatial resolution and 250 times better resolution of lighting levels (dynamic range) than before. Also, because Suomi NPP is a civilian science satellite, data is available to scientists within minutes to hours of acquisition.
           </p>
          </blockquote>
          <p>
           白天的卫星数据我接触多了，但晚上的一直是望而却步。大数据来了，从原始数据到最后的图，每一步都有统计方法在支持。到最后，白天和黑夜的分别也不是那么明显了，那些方法还叫不叫统计也不重要了。
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 22:44
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/black-marble/" rel="tag">
           Black Marble
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/nasa/" rel="tag">
           NASA
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/virrs/" rel="tag">
           VIRRS
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%9c%b0%e7%90%83/" rel="tag">
           地球
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%9f%8e%e5%b8%82%e7%81%af%e5%85%89/" rel="tag">
           城市灯光
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%a4%a7%e6%95%b0%e6%8d%ae/" rel="tag">
           大数据
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-1771 post type-post status-publish format-standard hentry category-91 category-63 category-61 category-62 category-84 tag-93 tag-74 tag-96 category-91-id category-63-id category-61-id category-62-id category-84-id post-seq-6 post-parity-even meta-position-corners fix" id="post-1771">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/08/07/%e5%a5%bd%e7%9a%84%e5%92%8c%e4%b8%8d%e8%b4%9f%e8%b4%a3%e4%bb%bb%e7%9a%84%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90%e5%9c%a8%e3%80%8a%e8%87%aa%e7%84%b6%e3%80%8b%e6%9d%82%e5%bf%97%e4%ba%89%e8%ae%ae%e6%96%87/" rel="bookmark" title="好的和不负责任的数据分析在《自然》杂志争议文章中的完全体现">
            好的和不负责任的数据分析在《自然》杂志争议文章中的完全体现
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e4%bd%93%e8%82%b2/" rel="category tag">
             体育
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%a7%91%e5%ad%a6/" rel="category tag">
             科学
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/" rel="category tag">
             统计
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/08/07/%e5%a5%bd%e7%9a%84%e5%92%8c%e4%b8%8d%e8%b4%9f%e8%b4%a3%e4%bb%bb%e7%9a%84%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90%e5%9c%a8%e3%80%8a%e8%87%aa%e7%84%b6%e3%80%8b%e6%9d%82%e5%bf%97%e4%ba%89%e8%ae%ae%e6%96%87/#respond">
             No Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           8月
          </span>
          <span class="day">
           07
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-08-07T00:27:10+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           引起热议的《自然》杂志新闻文章
           <a href="http://www.nature.com/news/why-great-olympic-feats-raise-suspicions-1.11109" target="_blank">
            Why great Olympic feats raise suspicions
           </a>
           今天有了新进展。杂志的主编
           <strong>
            <em>
             Tim Appenzeller
            </em>
           </strong>
           <em>
            Chief Magazine Editor,
           </em>
           Nature 和
           <strong>
            <em>
             Philip Campbell
            </em>
           </strong>
           <em>
            Editor-in-Chief,
           </em>
           Nature 发了说明
           <a href="http://www.nature.com/news/why-great-olympic-feats-raise-suspicions-1.11109#/ed_note_continued" target="_blank">
            an editor’s note
           </a>
           并向读者和叶诗文道歉 (这是11:40am EST, August 6, 2012我看到的)
          </p>
          <blockquote>
           <h2>
            <strong>
             EDITORS’ NOTE (continued)
            </strong>
           </h2>
           <p>
            <em>
             The news story was triggered by a debate that was already active, concerning the scale of Ye Shiwen’s victory. Such debates have arisen over many outstanding feats in the past, by athletes from many countries, and it is wrong to suggest, as many of the critics do, that we singled her out because of her nationality.
            </em>
           </p>
           <p>
            <em>
             The story’s intention as an Explainer was to examine how science can help resolve debates over extraordinary performances, not to examine those performance statistics in detail. Several analyses done by others convinced us that it was fair to characterize Ye’s performance as ‘anomalous’ — in the sense that it was statistically unusual. But we acknowledge that the combination of errors discussed above and the absence of a more detailed discussion of the statistics (which with hindsight we regret) gave the impression that we were supporting accusations against her, even though this was emphatically not our intention. For that, we apologize to our readers and to Ye Shiwen.
            </em>
           </p>
           <p>
            <strong>
             <em>
              Tim Appenzeller
             </em>
            </strong>
            <em>
             Chief Magazine Editor,
            </em>
            Nature
            <br/>
            <strong>
             <em>
              Philip Campbell
             </em>
            </strong>
            <em>
             Editor-in-Chief,
            </em>
            Nature
           </p>
          </blockquote>
          <p>
           前两天我也对原文的统计分析
           <a href="http://blog.cos.name/taoshi/2012/08/02/nature-why-great-olympic-feats-raise-suspicions/" target="_blank">
            有质疑
           </a>
           ，连饶毅写了
           <a href="http://blog.sciencenet.cn/blog-2237-598917.html" target="_blank">
            致《自然》杂志总编的信
           </a>
           。看到
           <a href="http://www.nature.com/news/why-great-olympic-feats-raise-suspicions-1.11109#/Lai_Jiang" target="_blank">
            好的统计分析
           </a>
           把烂文章指点的体无完肤，还是挺有感触的。
          </p>
          <p>
           但是我还是对总编的中的一句话不解：
           <strong>
            “
            <em>
             Several analyses done by others convinced us that it was fair to characterize Ye’s performance as ‘anomalous’ — in the sense that it was statistically unusual.”
            </em>
           </strong>
          </p>
          <p>
           我希望这 “fair”是一个笔误, 但或许不是呢。如果主编被说服相信叶诗文的表现是离谱的，那主编们能不能指出是那个分析让你们相信叶诗文的表现不正常呢？我有15年以上在大学中学习，教授，和研究统计的经历，但我怎么从评论中看到的大多是指出叶诗文的表现没有不正常呢？
          </p>
          <p>
           希望你们这一次不再为没有包括详细的统计分析而后悔！
          </p>
          <p>
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 00:27
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e5%8f%b6%e8%af%97%e6%96%87/" rel="tag">
           叶诗文
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%a5%a5%e6%9e%97%e5%8c%b9%e5%85%8b/" rel="tag">
           奥林匹克
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e8%87%aa%e7%84%b6/" rel="tag">
           自然
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-1764 post type-post status-publish format-standard hentry category-91 category-63 category-61 category-62 category-84 tag-93 tag-74 tag-95 tag-92 tag-94 category-91-id category-63-id category-61-id category-62-id category-84-id post-seq-7 post-parity-odd meta-position-corners fix" id="post-1764">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/08/02/nature-why-great-olympic-feats-raise-suspicions/" rel="bookmark" title="Nature文章: 为何好的奥林匹克成绩引起怀疑">
            Nature文章: 为何好的奥林匹克成绩引起怀疑
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e4%bd%93%e8%82%b2/" rel="category tag">
             体育
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%a7%91%e5%ad%a6/" rel="category tag">
             科学
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/" rel="category tag">
             统计
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/08/02/nature-why-great-olympic-feats-raise-suspicions/#comments">
             4 Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           8月
          </span>
          <span class="day">
           02
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-08-02T15:40:52+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           8/9/2012，更新：今天收到《自然》杂志自动生成邮件：
          </p>
          <p>
           The following post you wrote on the Nature News website has been hidden by the moderator in accordance with our terms and conditions.
          </p>
          <blockquote>
           <p>
            To editor Brian Owens:
            <br/>
            I wonder the so called ‘performance profiling’, as mentioned in the title of this article, could be used to judge if the editor was drunk on duty or is lack of basic knowledge of Statistics.
           </p>
           <p>
            If this is article used to highlight what so called science with crappy data analysis cannot tell us, congratulations! You passed with A+.
           </p>
          </blockquote>
          <p>
           This comment contains abusive language and as such breaches our Terms of Service.
          </p>
          <p>
           –
           <em>
            Nature News
           </em>
           editors
          </p>
          <p>
           －－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－
          </p>
          <p>
           本以为可以停下来对数字的兴趣来看几天奥运，但看了
           <a href="http://www.nature.com/nature/index.html" target="_blank">
            Nature杂志
           </a>
           的一篇文章， “
           <a href="http://www.nature.com/news/why-great-olympic-feats-raise-suspicions-1.11109" target="_blank">
            Why great Olympic feats raise suspicions, ‘Performance profiling’ could help to dispel doubts
           </a>
           “，后还是忍不住写点什么。
          </p>
          <p>
           看了文章马上让我想起这样的书目：
           <a href="http://www.amazon.com/Damned-Lies-Statistics-Untangling-Politicians/dp/0520219783/" target="_blank">
            Damned Lies and Statistics: Untangling Numbers from the Media, Politicians, and Activists
           </a>
           and
           <a href="http://www.amazon.com/More-Damned-Lies-Statistics-Numbers/dp/0520238303/" target="_blank">
            More Damned Lies and Statistics: How Numbers Confuse Public Issues
           </a>
           .
          </p>
          <p>
           NAUTRE, 你叫人情何以堪？我现在还是不把你分类到新闻媒体之列，但或许你很快就证明我是错的。
          </p>
          <div class="wp-caption aligncenter" style="width: 410px">
           <img src="http://www.nature.com/polopoly_fs/7.5628.1343835371!/image/149445070%20reduced.jpg_gen/derivatives/landscape_400/149445070%20reduced.jpg"/>
           <p class="wp-caption-text">
            L. NEAL /AFP / GETTY IMAGES
           </p>
          </div>
          <blockquote>
           <p>
            <strong>
             Was Ye’s performance anomalous?
            </strong>
            <br/>
            Yes. Her time in the 400 IM was more than 7 seconds faster than her time in the same event at a major meet in July. But what really raised eyebrows was her showing in the last 50 metres, which she swam faster than US swimmer Ryan Lochte did when he won gold in the men’s 400 IM on Saturday, with the second-fastest time ever for that event.
           </p>
          </blockquote>
          <p>
           比较叶诗文和罗切特在400米混合泳的最后50米时间太误导。 这样的分析写新闻报道还可以，要鳌头吗！可稍微有点统计常识的人都不会只用这样简单的数字比较来支持严格的观点的。 有位读者
           <a href="http://www.nature.com/news/why-great-olympic-feats-raise-suspicions-1.11109#/comment-47487" target="_blank">
            Lai Jiang
           </a>
           评论的很到位：
          </p>
          <blockquote>
           <p>
            First, to compare a player’s performance increase, the author used Ye’s 400m IM time and her performance at the World championship 2011, which are 4:28.43 and 4:35.15 respectively, and reached the conclusion that she has got an “anomalous” increase by ~7 sec (6.72 sec). In fact she’s previous personal best was 4:33.79 at Asian Games 2010
            <sup>
             <a href="http://www.nature.com/news/why-great-olympic-feats-raise-suspicions-1.11109#fnad852dd0f9344e4c9394fd447fd36629">
              1
             </a>
            </sup>
            . This leads to a 5.38 sec increase. In a sport event that 0.1 sec can be the difference between the gold and silver medal, I see no reason that 5.38 sec can be treated as 7 sec. ……
           </p>
           <p>
            Third, to compare Ryan Lochte’s last 50m to Ye’s is a textbook example of what we call to cherry pick your data. Yes, Lochte is slower than Ye in the last 50m, but (as pointed out by Zhenxi) Lochte has a huge lead in the first 300m so that he chose to not push himself too hard to conserve energy for latter events (whether this conforms to the Olympic spirit and the “use one’s best efforts to win a match” requirement that the BWF has recently invoked to disqualify four badminton pairs is another topic worth discussing, probably not in Nature, though). On the contrary, Ye is trailing behind after the first 300m and relies on freestyle, which she has an edge, to win the game. Failing to mention this strategic difference, as well as the fact that Lochte is 23.25 sec faster (4:05.18) over all than Ye creates the illusion that a woman swam faster than the best man in the same sport, which sounds impossible. Put aside the gender argument, I believe this is still a leading question that implies the reader that something fishy is going on.
           </p>
           <p>
            Fourth, another example of cherry picking. In the same event there are four male swimmers that swam faster than both Lochter (29.10 sec)3 and Ye (28.93 sec)4: Hagino (28.52 sec), Phelps (28.44 sec), Horihata (27.87 sec) and Fraser-Holmes (28.35 sec). As it turns out if we are just talking about the last 50m in a 400m IM, Lochter would not have been the example to use if I were the author. What kind of scientific rigorousness that author is trying to demonstrate here? Is it logical that if Lochter is the champion, we should assume he leads in every split? That would be a terrible way to teach the public how science works.
           </p>
          </blockquote>
          <p>
           我是真心希望象Nature这样的顶尖杂志能认真些。或许Nature
           <a href="http://www.nature.com/news/why-great-olympic-feats-raise-suspicions-1.11109#/comment-47526" target="_blank">
            线上新闻主编的回答
           </a>
           可以解释：
          </p>
          <blockquote>
           <p>
            We appreciate that the case of Ye Shiwen is a sensitive one for some readers. However, I would like to point out that this story was not intended to insinuate that Ye is guilty of anything. As we point out in the first paragraph, she has never failed a drug test and so is the rightful Olympic champion.
           </p>
           <p>
            We wanted to use the controversy as a way to highlight what science can and can’t tell us with respect to athletes’ performance. We have done similar stories before, for example in the case of South African runner
            <a href="http://www.nature.com/news/2009/090820/full/news.2009.850.html">
             Caster Semenya
            </a>
           </p>
           <p>
            Congratulations to Ye Shiwen on her incredible win!
           </p>
           <p>
            Brian Owens
            <br/>
            Online news editor
           </p>
          </blockquote>
          <p>
           我怀疑文章标题中的’performance profiling’ 方法是否可以用来猜测主编是在审这稿时喝醉了呢，还是缺乏基本的统计知识。如果这文章是象主编所说的用来展示什么是用糊涂数据分析支持的科学不能发现的，恭喜你！你的表现太好了。
          </p>
          <p>
           归根结底，数字只是数字，但每个数字后面都有它的故事。别只看到数字的表面标价（¥6 或 $1）!
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 15:40
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e5%8f%b6%e8%af%97%e6%96%87/" rel="tag">
           叶诗文
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%a5%a5%e6%9e%97%e5%8c%b9%e5%85%8b/" rel="tag">
           奥林匹克
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e6%b8%b8%e6%b3%b3/" rel="tag">
           游泳
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e8%87%aa%e7%84%b6%e6%9d%82%e5%bf%97/" rel="tag">
           自然杂志
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e8%ae%b0%e5%bd%95/" rel="tag">
           记录
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-1709 post type-post status-publish format-standard hentry category-63 category-3 tag-74 tag-73 category-63-id category-3-id post-seq-8 post-parity-even meta-position-corners fix" id="post-1709">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/07/19/%e7%9c%bc%e4%bf%9d%e5%81%a5%e6%93%8d%e4%b8%8e%e7%9c%bc%e4%bf%9d%e5%81%a5/" rel="bookmark" title="眼保健操与眼保健">
            眼保健操与眼保健
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e9%97%b2%e6%89%af/" rel="category tag">
             闲扯
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/07/19/%e7%9c%bc%e4%bf%9d%e5%81%a5%e6%93%8d%e4%b8%8e%e7%9c%bc%e4%bf%9d%e5%81%a5/#respond">
             No Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           7月
          </span>
          <span class="day">
           19
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-07-19T06:41:29+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           眼保健操引起热议，原因好像是因为有人的“过激“言论。以至于
           <a href="http://news.sina.com.cn/z/ybjc/" target="_blank">
            新观察
           </a>
           也撰文驳斥以下”眼保健操残害论“：
          </p>
          <blockquote>
           <p>
            近日，网友“直播上海”在其微博中称，“眼保健操残害中国青少年49年了，全世界仅中国做眼保健操，按摩毫无作用的穴位，49年来中国青少年近视率升至世界第二，达3.6亿人，做眼保健操无法改善视力，许多学生用脏手按摩导致红眼病、眼部感染等。眼保健操是于1963年，由北京医学院体育教研室刘世铭主任自创的，结果被强制在全国推行，毫无科学根据。”
           </p>
          </blockquote>
          <p>
           更有专家指出：
           <a href="http://news.sina.com.cn/s/2012-07-16/093924782246.shtml" target="_blank">
            <strong>
             好处显而易见
            </strong>
           </a>
          </p>
          <blockquote>
           <p>
            “
            <strong>
             尽管目前没有科学理论、临床试验证明做眼保健操确实能够预防近视，但它对眼睛的益处却显而易见。
            </strong>
            ”中国中医科学院眼科医院原院长高健生接受媒体采访时表示，眼保健操是根据医学推拿、经络理论结合体育医疗综合而成的按摩法。
           </p>
          </blockquote>
          <p>
           既然没有科学理论、也没有临床试验证，我就搞不懂这好处怎么
           <strong>
            显而易见
           </strong>
           呢？就好像我读数学论文时，最怕的就是“显然易见”和“证明从略”了。
          </p>
          <p>
           我也不支持微博中“眼保健操残害中国青少年”的最终论断，因为“做眼保健操无法改善视力”这还没有定论。但在没有“做眼保健操可以有效改善视力”的科学支持下，就被专家推出在大范围推广，现在回头看也挺可悲。当然当时的国情决定这样做是合理的。而且快50年来都没有被质疑，习惯也就成了自然了。
          </p>
          <p>
           既然不知道这操到底有用与否，何不现在花些精力设计试验，收集数据来研究清楚呢？
          </p>
          <p>
           不过卫生部近视眼重点实验室主任、上海市眼科质量控制中心主任、
           <a href="http://news.sina.com.cn/s/2012-07-16/093924782246.shtml" target="_blank">
            复旦大学眼科教授褚仁远建议说
           </a>
           ，
          </p>
          <blockquote>
           <p>
            青少年可以每天花5分钟时间，把食指竖直放在眼前，前后移动
            <strong>
            </strong>
            <em>
             <strong>
              练习对眼
             </strong>
            </em>
            。眼睛功能可以得到调节，从而预防近视。
           </p>
          </blockquote>
          <p>
           虽然有些匪夷所思，没准有奇效。但专家还是有些实际数据支持再支招吧。我外行拍拍脑袋也可以说：“如果全国取消变态的各级奥林匹克数学竞赛，而以奥林匹克体育竞赛代替之，近视率肯定下降。” 还有，这不着谱的“
           <a href="http://www.aoshu.com/e/20090526/4b8bca79d5b79.shtml" target="_blank">
            全国小学语文奥林匹克技能大赛
           </a>
           ”更无赖。看看这坑爹的题谁会：
          </p>
          <div class="wp-caption alignright" style="width: 310px">
           <img src="http://upload.wikimedia.org/wikipedia/en/4/44/HarryPotter5poster.jpg"/>
           <p class="wp-caption-text">
            不过好像魔法师眼睛也不行，何解？
           </p>
          </div>
          <p>
          </p>
          <p>
           7.《哈里.波特》一书中描写去魔法学校的站台是国王十字车站的（ ）。
          </p>
          <p>
           A.四分之一站台
          </p>
          <p>
           B.九又四分之一站台
          </p>
          <p>
           C.四分之三站台
          </p>
          <p>
           D.九又四分之三站台
          </p>
          <p>
           晕！！！ 这是考语文还是数学还是电影啊？
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 06:41
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e5%a5%a5%e6%9e%97%e5%8c%b9%e5%85%8b/" rel="tag">
           奥林匹克
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e7%9c%bc%e4%bf%9d%e5%81%a5%e6%93%8d/" rel="tag">
           眼保健操
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-1627 post type-post status-publish format-standard hentry category-63 category-61 category-66 tag-182 category-63-id category-61-id category-66-id post-seq-9 post-parity-odd meta-position-corners fix" id="post-1627">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/07/08/%e5%8d%9a%e8%b0%88%e7%bb%9f%e8%ae%a1%e5%ba%94%e7%94%a8/" rel="bookmark" title="博谈统计应用">
            博谈统计应用
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1%e5%ba%94%e7%94%a8/" rel="category tag">
             统计应用
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/07/08/%e5%8d%9a%e8%b0%88%e7%bb%9f%e8%ae%a1%e5%ba%94%e7%94%a8/#comments">
             1 Response »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           7月
          </span>
          <span class="day">
           08
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-07-08T19:06:14+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           终于找到了上月在西安和西北大学低年级同学交流时的幻灯片[
           <a href="http://www.stat.osu.edu/~taoshi/博谈统计应用.pdf" target="_blank">
            pdf
           </a>
           ]，分享一下。
          </p>
          <p>
           摘要广告如下：
           <br/>
           <img src="http://i.imgur.com/9fNCe.jpg"/>
           <br/>
           <img src="http://i.imgur.com/JEN5i.jpg"/>
           <br/>
           <img src="http://i.imgur.com/0HAT8.jpg"/>
           <br/>
           <img src="http://i.imgur.com/yI9Lx.jpg"/>
           <br/>
           <img src="http://i.imgur.com/32lz4.jpg"/>
           <br/>
           <img src="http://i.imgur.com/VVCob.jpg"/>
           <br/>
           <img src="http://i.imgur.com/MzYJ7.jpg"/>
           <br/>
           <img src="http://i.imgur.com/vBN6O.jpg"/>
          </p>
          <hr/>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 19:06
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/%e7%bb%9f%e8%ae%a1%e5%ba%94%e7%94%a8/" rel="tag">
           统计应用
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <article class="full-content post-1594 post type-post status-publish format-standard hentry category-63 category-61 category-62 tag-60 tag-boosting tag-58 tag-59 tag-64 category-63-id category-61-id category-62-id post-seq-10 post-parity-even meta-position-corners fix" id="post-1594">
        <header class="post-header title-container fix">
         <div class="title">
          <h2 class="posttitle">
           <a class="entry-title" href="http://blog.cos.name/taoshi/2012/07/06/%e5%b8%8c%e6%a0%bc%e6%96%af%e6%b3%a2%e8%89%b2%e5%ad%90/" rel="bookmark" title="希格斯玻色子与5σ">
            希格斯玻色子与5σ
           </a>
          </h2>
          <div class="postdata fix">
           <span class="category">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/" rel="category tag">
             媒体报道
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/" rel="category tag">
             数据分析
            </a>
            ,
            <a href="http://blog.cos.name/taoshi/category/%e7%a7%91%e5%ad%a6/" rel="category tag">
             科学
            </a>
           </span>
           <span class="comments">
            <span class="icon">
            </span>
            <a href="http://blog.cos.name/taoshi/2012/07/06/%e5%b8%8c%e6%a0%bc%e6%96%af%e6%b3%a2%e8%89%b2%e5%ad%90/#comments">
             7 Responses »
            </a>
           </span>
          </div>
          <!-- /.postdata -->
         </div>
         <!-- /.title -->
         <div class="date">
          <span class="month">
           7月
          </span>
          <span class="day">
           06
          </span>
          <span class="year">
           2012
          </span>
         </div>
        </header>
        <!-- /.title-container -->
        <span class="post-format-icon">
        </span>
        <span class="updated" title="2012-07-06T13:04:09+00:00">
        </span>
        <div class="entry-container fix">
         <div class="entry entry-content fix">
          <p>
           <strong>
            [更新，2012年7月14日]
           </strong>
           ：推荐对数据分析有兴趣的听一下这神粒子的声音（
           <a href="http://lhcsound.hep.ucl.ac.uk/page_sounds_higgs/Higgs.html" target="_blank">
            Listen to the decay of a god particle
           </a>
           ）。一群粒子物理学家，编曲家，软件工程师，和艺术家
           <a href="http://lhcsound.hep.ucl.ac.uk/page_about/About.html" target="_blank">
            用粒子对撞机的数据编成的曲目
           </a>
           。另类的数据展示！太强大了。
          </p>
          <p>
           2012年7月4日，欧洲核子研究组织（CERN， the
           <a href="http://public.web.cern.ch/public/en/About/Name-en.html" title="more about the CERN name">
            European Organization for Nuclear Research
           </a>
           ）的
           <a href="http://www.huanqiukexue.com/html/newqqkj/newwl/2012/0704/22320.html" target="_blank">
            物理学家们宣布
           </a>
           发现在欧洲大型强子对撞机中一种疑似
           <a href="http://zh.wikipedia.org/wiki/希格斯玻色子" target="_blank">
            希格斯玻色子
           </a>
           （
           <a href="http://en.wikipedia.org/wiki/Higgs_boson" target="_blank">
            Higgs Boson
           </a>
           ）。
          </p>
          <blockquote>
           <p>
            ［抄自wikipedia］：希格斯玻色子是
            <a href="http://zh.wikipedia.org/wiki/%E7%B2%92%E5%AD%90%E7%89%A9%E7%90%86%E5%AD%B8" title="粒子物理學">
             粒子物理學
            </a>
            的
            <a href="http://zh.wikipedia.org/wiki/標準模型">
             标准模型
            </a>
            所预言的一种
            <a href="http://zh.wikipedia.org/wiki/%E5%9F%BA%E6%9C%AC%E7%B2%92%E5%AD%90" title="基本粒子">
             基本粒子
            </a>
            。
            <a href="http://zh.wikipedia.org/wiki/標準模型">
             标准模型
            </a>
            预言了62种基本粒子，希格斯玻色子是最后一种有待被实验证实的粒子。在希格斯玻色子是以物理学者
            <a href="http://zh.wikipedia.org/wiki/%E5%BD%BC%E5%BE%97%C2%B7%E5%B8%8C%E6%A0%BC%E6%96%AF" title="彼得·希格斯">
             彼得·希格斯
            </a>
            命名。由于它对于基本粒子的基础性质扮演极为重要的角色，因此在大众传媒中又被称为「上帝粒子」。
           </p>
          </blockquote>
          <p>
           近50年来，物理学家们一直在追寻希格斯玻色子，因为它的发现将使粒子物理的标准模型得到完善。下面的小片子通俗地讲了一下什么是希格斯玻色子。
          </p>
          <p>
           <object align="middle" classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0" height="400" width="480">
            <param name="src" value="http://player.youku.com/player.php/sid/XNDIzNDExMTUy/v.swf">
            </param>
            <param name="allowfullscreen" value="true">
            </param>
            <param name="quality" value="high">
            </param>
            <param name="allowscriptaccess" value="always">
            </param>
            <embed align="middle" allowfullscreen="true" allowscriptaccess="always" height="400" quality="high" src="http://player.youku.com/player.php/sid/XNDIzNDExMTUy/v.swf" type="application/x-shockwave-flash" width="480">
            </embed>
           </object>
          </p>
          <p>
           作为只有高中物理水平的民科，我也能从物理学家们在宣布这发现时的激动（看下面视频）中感到这发现的重大。
          </p>
          <p>
           <object align="middle" classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0" height="400" width="480">
            <param name="src" value="http://player.youku.com/player.php/sid/XNDIzNjIwOTY4/v.swf">
            </param>
            <param name="allowfullscreen" value="true">
            </param>
            <param name="quality" value="high">
            </param>
            <param name="allowscriptaccess" value="always">
            </param>
            <embed align="middle" allowfullscreen="true" allowscriptaccess="always" height="400" quality="high" src="http://player.youku.com/player.php/sid/XNDIzNjIwOTY4/v.swf" type="application/x-shockwave-flash" width="480">
            </embed>
           </object>
          </p>
          <p>
           除了表达对科学家的敬仰外，我也对其中提到的 5σ 很感兴趣。既然祖师爷
           <a href="http://en.wikipedia.org/wiki/John_Tukey" target="_blank">
            John Tukey
           </a>
           说过
          </p>
          <blockquote>
           <p>
            The
            <em>
             best
            </em>
            thing about being a
            <em>
             statistician
            </em>
            is that you get to play in everyone’s backyard，
           </p>
          </blockquote>
          <p>
           我倍受鼓励的来看看这 5σ 到底是怎么回事。视频中的点睛之笔：
          </p>
          <blockquote>
           <p>
            <em>
             We have observed a new boson with a mass of 125.3 +- 0.6 GeV at 4.9 σ significance.
            </em>
           </p>
          </blockquote>
          <p>
           念玩后大家鼓掌拥抱，热泪盈眶。一番周折后，我才终于找到了CERN的
           <strong>
            <a href="https://cdsweb.cern.ch/record/1459565" target="_blank">
             原版视频
            </a>
           </strong>
           （将近两小时，值得看看）。
          </p>
          <p>
           开始时只是想搞清楚这 5σ 怎么回事（35：10,第84页），没想到听到一堆统计词汇“multivariate analysis technique”，“p-value”,”sensitivity”, 等等劈头盖脸的飞来。最给力的是 Rolf Heuer 讲了一些用
           <a href="http://en.wikipedia.org/wiki/Boosting" target="_blank">
            Boosted decision tree
           </a>
           来提高分类器准确性的过程（18：20,第33页）。不出所料，研究中用到了很前沿的数据分析方法。老祖师果然没错。看来欲知其中细节，得看数据分析啊！
          </p>
          <p>
           比较遗憾的是我比较看不懂的是
           <a href="http://www.huanqiukexue.com/html/newqqkj/newwl/2012/0704/22320.html" target="_blank">
            环球科学
           </a>
           <a href="http://www.huanqiukexue.com/html/newqqkj/newwl/2012/0704/22320.html" target="_blank">
            （
           </a>
           <a href="http://www.huanqiukexue.com/html/newqqkj/newwl/2012/0704/22320.html" target="_blank">
            科
           </a>
           <a href="http://www.huanqiukexue.com/html/newqqkj/newwl/2012/0704/22320.html" target="_blank">
            学美国人中文版）的文章
           </a>
           “希格斯粒子现身LHC？”最后对 5σ 的解释：
          </p>
          <blockquote>
           <p>
            估计总体参数落在某一区间内，可能犯错误的概率为显著性水平，用α表示。1-α 为置信度或置信水平，其表明了区间估计的可靠性。显著性水平不是一个固定不变的数字，其越大，则原假设被拒绝的可能性愈大，文章中置信度为5σ（5个标准误差），说明原假设的可信程度达到了99.99997%
           </p>
          </blockquote>
          <p>
           好像这是把假设检验和置信区间绞在一起解释了。本来看了视频还我还觉着我这物理外行也看懂了，现在又被解释糊涂了。谁能看懂给解释一下？
          </p>
          <p>
          </p>
         </div>
         <!--entry -->
        </div>
        <!-- .entry-container -->
        <footer class="post-footer postdata fix">
         <span class="author">
          <span class="icon">
          </span>
          Posted by
          <span class="vcard">
           <a class="url fn" href="http://blog.cos.name/taoshi/author/taoshi/" rel="author">
            施涛
           </a>
          </span>
          at 13:04
         </span>
         <span class="tags tax">
          <span class="icon">
          </span>
          Tagged with:
          <a href="http://blog.cos.name/taoshi/tag/5%cf%83/" rel="tag">
           5σ
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/boosting/" rel="tag">
           Boosting
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e5%b8%8c%e6%a0%bc%e6%96%af%e7%8e%bb%e8%89%b2%e5%ad%90/" rel="tag">
           希格斯玻色子
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e6%ac%a7%e6%b4%b2%e5%a4%a7%e5%9e%8b%e5%bc%ba%e5%ad%90%e5%af%b9%e6%92%9e%e6%9c%ba/" rel="tag">
           欧洲大型强子对撞机
          </a>
          ,
          <a href="http://blog.cos.name/taoshi/tag/%e7%bd%ae%e4%bf%a1%e5%8c%ba%e9%97%b4/" rel="tag">
           置信区间
          </a>
         </span>
        </footer>
        <!-- .post-footer -->
       </article>
       <!--post -->
       <div class="page-nav fix">
        <span class="previous-entries">
         <a href="http://blog.cos.name/taoshi/category/%E5%AA%92%E4%BD%93%E6%8A%A5%E9%81%93/page/2/">
          <span class="icon">
          </span>
          Older Entries
         </a>
        </span>
        <span class="next-entries">
        </span>
       </div>
       <!-- page nav -->
      </div>
      <!-- content -->
     </div>
     <!-- main col -->
     <div class="sidebar-shell sidebar-shell-right" id="sidebar-shell-1">
      <div class="dbx-group right boxed warea" id="sidebar">
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_recent_entries" id="recent-posts-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          近期文章
         </h3>
         <ul>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/05/25/%ef%bc%bb%e6%9c%9d%e8%8a%b1%e5%a4%95%e6%8b%be%ef%bc%bd%e4%bb%8e%e5%ad%a6%e4%b9%a0%e6%95%b0%e5%ad%a6%e5%85%ac%e5%bc%8f%e5%88%b0%e5%ae%9e%e8%b7%b5%e7%bb%9f%e8%ae%a1%e5%88%86%e6%9e%90/">
            [朝花夕拾] 从学习数学公式到实践统计分析
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/05/12/%e6%9c%9d%e8%8a%b1%e5%a4%95%e6%8b%be%ef%bc%9a%e8%bf%8e%e6%8e%a5%e4%bf%a1%e6%81%af%e6%97%b6%e4%bb%a3%e7%9a%84%e7%bb%9f%e8%ae%a1%e6%8c%91%e6%88%98/">
            [朝花夕拾] 迎接信息时代的统计挑战
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/04/13/%e5%a4%b1%e8%81%94%e6%90%9c%e6%95%91%e4%b8%ad%e7%9a%84%e7%bb%9f%e8%ae%a1%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/">
            失联搜救中的统计数据分析
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/02/13/%e6%96%b0%e5%b9%b4%e5%88%b0%ef%bc%8c%e5%8f%91%e7%ba%a2%e5%8c%85%ef%bc%88%e4%b9%8b%e4%b8%80%ef%bc%89%e5%a4%a7%e5%ae%b6%e5%a6%82%e4%bd%95%e5%8f%91%e7%ba%a2%e5%8c%85%ef%bc%9f/">
            新年到，发红包（之一）大家如何发红包？
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/10/03/%e7%bd%91%e4%b8%8a%e9%97%ae%e5%8d%b7%ef%bc%8c%e7%bc%ba%e5%a4%b1%e6%95%b0%e6%8d%ae%e5%92%8c%e6%95%b0%e6%8d%ae%e9%9a%90%e7%a7%81/">
            网上问卷，缺失数据和数据隐私
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/08/28/%e8%88%aa%e6%b5%b7%e5%ae%b61%e5%8f%b7%e7%a6%bb%e5%bc%80%e5%a4%aa%e9%98%b3%e7%b3%bb%e4%ba%86%e5%90%97%ef%bc%9f/">
            航海家1号离开太阳系了吗？
           </a>
          </li>
         </ul>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_archive" id="archives-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          文章归档
         </h3>
         <ul>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/05/">
            2014年五月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/04/">
            2014年四月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2014/02/">
            2014年二月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/10/">
            2013年十月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/08/">
            2013年八月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/07/">
            2013年七月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/06/">
            2013年六月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/05/">
            2013年五月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/04/">
            2013年四月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/02/">
            2013年二月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2013/01/">
            2013年一月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/12/">
            2012年十二月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/11/">
            2012年十一月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/10/">
            2012年十月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/08/">
            2012年八月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/07/">
            2012年七月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/06/">
            2012年六月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/05/">
            2012年五月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/04/">
            2012年四月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2012/02/">
            2012年二月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2011/12/">
            2011年十二月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2011/11/">
            2011年十一月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2011/10/">
            2011年十月
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/2011/09/">
            2011年九月
           </a>
          </li>
         </ul>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_categories" id="categories-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          分类目录
         </h3>
         <ul>
          <li class="cat-item cat-item-91">
           <a href="http://blog.cos.name/taoshi/category/%e4%bd%93%e8%82%b2/">
            体育
           </a>
           (2)
          </li>
          <li class="cat-item cat-item-63 current-cat">
           <a href="http://blog.cos.name/taoshi/category/%e5%aa%92%e4%bd%93%e6%8a%a5%e9%81%93/">
            媒体报道
           </a>
           (12)
          </li>
          <li class="cat-item cat-item-152">
           <a href="http://blog.cos.name/taoshi/category/%e6%95%99%e8%82%b2/">
            教育
           </a>
           (6)
          </li>
          <li class="cat-item cat-item-61">
           <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90/">
            数据分析
           </a>
           (22)
          </li>
          <li class="cat-item cat-item-23">
           <a href="http://blog.cos.name/taoshi/category/%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98/">
            数据挖掘
           </a>
           (7)
          </li>
          <li class="cat-item cat-item-62">
           <a href="http://blog.cos.name/taoshi/category/%e7%a7%91%e5%ad%a6/">
            科学
           </a>
           (7)
          </li>
          <li class="cat-item cat-item-84">
           <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1/">
            统计
           </a>
           (22)
          </li>
          <li class="cat-item cat-item-83">
           <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1%e5%92%a8%e8%af%a2/">
            统计咨询
           </a>
           (3)
          </li>
          <li class="cat-item cat-item-66">
           <a href="http://blog.cos.name/taoshi/category/%e7%bb%9f%e8%ae%a1%e5%ba%94%e7%94%a8/">
            统计应用
           </a>
           (15)
          </li>
          <li class="cat-item cat-item-76">
           <a href="http://blog.cos.name/taoshi/category/%e8%81%8c%e4%b8%9a%e4%bb%8b%e7%bb%8d/">
            职业介绍
           </a>
           (5)
          </li>
          <li class="cat-item cat-item-124">
           <a href="http://blog.cos.name/taoshi/category/%e8%af%bb%e4%b9%a6/">
            读书
           </a>
           (2)
          </li>
          <li class="cat-item cat-item-77">
           <a href="http://blog.cos.name/taoshi/category/%e8%bd%ac%e8%bd%bd/">
            转载
           </a>
           (1)
          </li>
          <li class="cat-item cat-item-3">
           <a href="http://blog.cos.name/taoshi/category/%e9%97%b2%e6%89%af/">
            闲扯
           </a>
           (14)
          </li>
         </ul>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_links" id="linkcat-125">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          链接链接
         </h3>
         <ul class="xoxo blogroll">
          <li>
           <a href="http://www.statsblogs.com">
            Statsblogs
           </a>
          </li>
          <li>
           <a href="http://www.matrix67.com/blog/">
            Matrix67
           </a>
          </li>
          <li>
           <a href="http://cos.name">
            统计之都
           </a>
          </li>
          <li>
           <a href="http://www.itongji.cn">
            中国统计网
           </a>
          </li>
          <li>
           <a href="http://www.loyhome.com">
            落园
           </a>
          </li>
          <li>
           <a href="http://yihui.name/cn/">
            歇一会
           </a>
          </li>
          <li>
           <a href="http://yixuan.cos.name/cn/">
            怡然軒
           </a>
          </li>
          <li>
           <a href="http://www.puddingnnn.com">
            他山布丁
           </a>
          </li>
          <li>
           <a href="http://www.bjt.name">
            刘思喆@贝吉塔行星
           </a>
          </li>
          <li>
           <a href="http://blog.sciencenet.cn/home.php?mod=space&amp;uid=2024">
            熵.复杂程度.统计.气象.水
           </a>
          </li>
         </ul>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_tag_cloud" id="tag_cloud-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          Tags
         </h3>
         <div class="tagcloud">
          <a class="tag-link-60 tag-link-position-1" href="http://blog.cos.name/taoshi/tag/5%cf%83/" style="font-size: 8pt;" title="1个话题">
           5σ
          </a>
          <a class="tag-link-8 tag-link-position-2" href="http://blog.cos.name/taoshi/tag/air-pollution/" style="font-size: 8pt;" title="1个话题">
           air pollution
          </a>
          <a class="tag-link-24 tag-link-position-3" href="http://blog.cos.name/taoshi/tag/berkeley/" style="font-size: 22pt;" title="5个话题">
           Berkeley
          </a>
          <a class="tag-link-4 tag-link-position-4" href="http://blog.cos.name/taoshi/tag/black-box/" style="font-size: 8pt;" title="1个话题">
           black box
          </a>
          <a class="tag-link-138 tag-link-position-5" href="http://blog.cos.name/taoshi/tag/critical-thinking/" style="font-size: 13.25pt;" title="2个话题">
           critical thinking
          </a>
          <a class="tag-link-139 tag-link-position-6" href="http://blog.cos.name/taoshi/tag/david-a-freedman/" style="font-size: 16.75pt;" title="3个话题">
           David A. Freedman
          </a>
          <a class="tag-link-44 tag-link-position-7" href="http://blog.cos.name/taoshi/tag/discovery/" style="font-size: 8pt;" title="1个话题">
           discovery
          </a>
          <a class="tag-link-9 tag-link-position-8" href="http://blog.cos.name/taoshi/tag/fine-particulate-matter/" style="font-size: 8pt;" title="1个话题">
           fine particulate matter
          </a>
          <a class="tag-link-53 tag-link-position-9" href="http://blog.cos.name/taoshi/tag/leo-breiman/" style="font-size: 8pt;" title="1个话题">
           Leo Breiman
          </a>
          <a class="tag-link-10 tag-link-position-10" href="http://blog.cos.name/taoshi/tag/meta-analysis/" style="font-size: 8pt;" title="1个话题">
           meta-analysis
          </a>
          <a class="tag-link-18 tag-link-position-11" href="http://blog.cos.name/taoshi/tag/national-public-radio/" style="font-size: 8pt;" title="1个话题">
           national public radio
          </a>
          <a class="tag-link-19 tag-link-position-12" href="http://blog.cos.name/taoshi/tag/npr/" style="font-size: 8pt;" title="1个话题">
           NPR
          </a>
          <a class="tag-link-54 tag-link-position-13" href="http://blog.cos.name/taoshi/tag/peter-bickel/" style="font-size: 8pt;" title="1个话题">
           Peter Bickel
          </a>
          <a class="tag-link-11 tag-link-position-14" href="http://blog.cos.name/taoshi/tag/pm2-5/" style="font-size: 8pt;" title="1个话题">
           pm2.5
          </a>
          <a class="tag-link-6 tag-link-position-15" href="http://blog.cos.name/taoshi/tag/prediction/" style="font-size: 8pt;" title="1个话题">
           prediction
          </a>
          <a class="tag-link-30 tag-link-position-16" href="http://blog.cos.name/taoshi/tag/probability/" style="font-size: 8pt;" title="1个话题">
           probability
          </a>
          <a class="tag-link-12 tag-link-position-17" href="http://blog.cos.name/taoshi/tag/ralph-kahn/" style="font-size: 8pt;" title="1个话题">
           Ralph Kahn
          </a>
          <a class="tag-link-13 tag-link-position-18" href="http://blog.cos.name/taoshi/tag/satellite/" style="font-size: 8pt;" title="1个话题">
           satellite
          </a>
          <a class="tag-link-45 tag-link-position-19" href="http://blog.cos.name/taoshi/tag/social-study/" style="font-size: 8pt;" title="1个话题">
           social study
          </a>
          <a class="tag-link-179 tag-link-position-20" href="http://blog.cos.name/taoshi/tag/statistics/" style="font-size: 16.75pt;" title="3个话题">
           Statistics
          </a>
          <a class="tag-link-20 tag-link-position-21" href="http://blog.cos.name/taoshi/tag/super-bowl-ads/" style="font-size: 8pt;" title="1个话题">
           Super Bowl Ads
          </a>
          <a class="tag-link-26 tag-link-position-22" href="http://blog.cos.name/taoshi/tag/terry-speed/" style="font-size: 8pt;" title="1个话题">
           Terry Speed
          </a>
          <a class="tag-link-46 tag-link-position-23" href="http://blog.cos.name/taoshi/tag/twitter-2/" style="font-size: 8pt;" title="1个话题">
           Twitter
          </a>
          <a class="tag-link-14 tag-link-position-24" href="http://blog.cos.name/taoshi/tag/yang-liu/" style="font-size: 8pt;" title="1个话题">
           Yang Liu
          </a>
          <a class="tag-link-31 tag-link-position-25" href="http://blog.cos.name/taoshi/tag/%e4%ba%ba%e5%8f%a3%e6%99%ae%e6%9f%a5/" style="font-size: 8pt;" title="1个话题">
           人口普查
          </a>
          <a class="tag-link-93 tag-link-position-26" href="http://blog.cos.name/taoshi/tag/%e5%8f%b6%e8%af%97%e6%96%87/" style="font-size: 13.25pt;" title="2个话题">
           叶诗文
          </a>
          <a class="tag-link-114 tag-link-position-27" href="http://blog.cos.name/taoshi/tag/%e5%a4%a7%e6%95%b0%e6%8d%ae/" style="font-size: 19.666666666667pt;" title="4个话题">
           大数据
          </a>
          <a class="tag-link-74 tag-link-position-28" href="http://blog.cos.name/taoshi/tag/%e5%a5%a5%e6%9e%97%e5%8c%b9%e5%85%8b/" style="font-size: 16.75pt;" title="3个话题">
           奥林匹克
          </a>
          <a class="tag-link-58 tag-link-position-29" href="http://blog.cos.name/taoshi/tag/%e5%b8%8c%e6%a0%bc%e6%96%af%e7%8e%bb%e8%89%b2%e5%ad%90/" style="font-size: 8pt;" title="1个话题">
           希格斯玻色子
          </a>
          <a class="tag-link-21 tag-link-position-30" href="http://blog.cos.name/taoshi/tag/%e5%b9%bf%e5%91%8a/" style="font-size: 8pt;" title="1个话题">
           广告
          </a>
          <a class="tag-link-22 tag-link-position-31" href="http://blog.cos.name/taoshi/tag/%e6%83%85%e7%bb%aa%e9%a2%84%e6%b5%8b/" style="font-size: 8pt;" title="1个话题">
           情绪预测
          </a>
          <a class="tag-link-180 tag-link-position-32" href="http://blog.cos.name/taoshi/tag/%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98/" style="font-size: 13.25pt;" title="2个话题">
           数据挖掘
          </a>
          <a class="tag-link-47 tag-link-position-33" href="http://blog.cos.name/taoshi/tag/%e6%96%b0%e6%b5%aa%e6%96%b0%e9%97%bb/" style="font-size: 8pt;" title="1个话题">
           新浪新闻
          </a>
          <a class="tag-link-59 tag-link-position-34" href="http://blog.cos.name/taoshi/tag/%e6%ac%a7%e6%b4%b2%e5%a4%a7%e5%9e%8b%e5%bc%ba%e5%ad%90%e5%af%b9%e6%92%9e%e6%9c%ba/" style="font-size: 8pt;" title="1个话题">
           欧洲大型强子对撞机
          </a>
          <a class="tag-link-15 tag-link-position-35" href="http://blog.cos.name/taoshi/tag/%e6%b0%91%e7%a7%91/" style="font-size: 8pt;" title="1个话题">
           民科
          </a>
          <a class="tag-link-27 tag-link-position-36" href="http://blog.cos.name/taoshi/tag/%e7%94%b7%e5%a5%b3%e6%af%94%e4%be%8b/" style="font-size: 8pt;" title="1个话题">
           男女比例
          </a>
          <a class="tag-link-48 tag-link-position-37" href="http://blog.cos.name/taoshi/tag/%e7%95%99%e5%ad%a6%e7%94%b3%e8%af%b7/" style="font-size: 8pt;" title="1个话题">
           留学申请
          </a>
          <a class="tag-link-50 tag-link-position-38" href="http://blog.cos.name/taoshi/tag/%e7%b2%be%e7%ae%97%e5%b8%88/" style="font-size: 8pt;" title="1个话题">
           精算师
          </a>
          <a class="tag-link-183 tag-link-position-39" href="http://blog.cos.name/taoshi/tag/%e7%bb%9f%e8%ae%a1/" style="font-size: 19.666666666667pt;" title="4个话题">
           统计
          </a>
          <a class="tag-link-51 tag-link-position-40" href="http://blog.cos.name/taoshi/tag/%e7%bb%9f%e8%ae%a1%e5%ad%a6%e5%ae%b6/" style="font-size: 8pt;" title="1个话题">
           统计学家
          </a>
          <a class="tag-link-64 tag-link-position-41" href="http://blog.cos.name/taoshi/tag/%e7%bd%ae%e4%bf%a1%e5%8c%ba%e9%97%b4/" style="font-size: 13.25pt;" title="2个话题">
           置信区间
          </a>
          <a class="tag-link-17 tag-link-position-42" href="http://blog.cos.name/taoshi/tag/%e8%b6%85%e7%ba%a7%e7%a2%97/" style="font-size: 8pt;" title="1个话题">
           超级碗
          </a>
          <a class="tag-link-41 tag-link-position-43" href="http://blog.cos.name/taoshi/tag/%e9%92%9f%e5%b1%b1%e8%af%b4%e4%ba%8b/" style="font-size: 8pt;" title="1个话题">
           钟山说事
          </a>
          <a class="tag-link-16 tag-link-position-44" href="http://blog.cos.name/taoshi/tag/%e9%9d%9e%e8%af%9a%e5%8b%bf%e6%89%b0/" style="font-size: 8pt;" title="1个话题">
           非诚勿扰
          </a>
          <a class="tag-link-42 tag-link-position-45" href="http://blog.cos.name/taoshi/tag/%e9%ab%98%e8%80%83/" style="font-size: 8pt;" title="1个话题">
           高考
          </a>
         </div>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget-suf-subscription" id="suf-subscription-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          Follow Me
         </h3>
         <form action="http://feedburner.google.com/fb/a/mailverify" class="aligncenter" method="post" onsubmit="window.open('http://feedburner.google.com/fb/a/mailverify?uri=your-feed-name', 'popupwindow', 'scrollbars=yes,width=550,height=520');return true" target="popupwindow">
          <p>
          </p>
         </form>
         <div class="fix">
         </div>
        </div>
       </aside>
       <!--widget end -->
       <!--widget start -->
       <aside class="dbx-box suf-widget widget_meta" id="meta-2">
        <div class="dbx-content">
         <h3 class="dbx-handle plain">
          功能
         </h3>
         <ul>
          <li>
           <a href="http://blog.cos.name/taoshi/wp-login.php">
            登录
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/feed/">
            文章
            <abbr title="Really Simple Syndication">
             RSS
            </abbr>
           </a>
          </li>
          <li>
           <a href="http://blog.cos.name/taoshi/comments/feed/">
            评论
            <abbr title="Really Simple Syndication">
             RSS
            </abbr>
           </a>
          </li>
          <li>
           <a href="https://cn.wordpress.org/" title="基于WordPress，一个优美、先进的个人信息发布平台。">
            WordPress.org
           </a>
          </li>
         </ul>
        </div>
       </aside>
       <!--widget end -->
      </div>
      <!--/sidebar -->
     </div>
    </div>
    <!-- /container -->
    <footer>
     <div id="cred">
      <table>
       <tbody>
        <tr>
         <td class="cred-left">
          © 2013
          <a href="http://blog.cos.name/taoshi">
           从数据中看规律
          </a>
         </td>
         <td class="cred-center">
         </td>
         <td class="cred-right">
          <a href="http://aquoid.com/news/themes/suffusion/">
           Suffusion theme by Sayontan Sinha
          </a>
         </td>
        </tr>
       </tbody>
      </table>
     </div>
    </footer>
    <!-- 67 queries, 49MB in 1.757 seconds. -->
   </div>
   <!--/wrapper -->
   <!-- location footer -->
  </div>
 </body>
</html>